在這個充滿奇幻與科技的異世界,我們將探索一種全新的知識推薦魔法。這種魔法利用了一種名為 embeddings 的神秘力量,能夠找到相似的新聞文章,帶領我們走向更深層的知識領域。
首先,我們需要準備資料,並且導入必要的套件。我們選擇了 AG 的新聞文章作為我們的數據集,並且將進行一些基本的數據探索,例如查看數據集的前幾行。
import pandas as pd
import pickle
from openai.embeddings_utils import (
get_embedding,
distances_from_embeddings,
tsne_components_from_embeddings,
chart_from_components,
indices_of_nearest_neighbors_from_distances,
)
# 加載數據
dataset_path = "data/AG_news_samples.csv"
df = pd.read_csv(dataset_path)
n_examples = 5
df.head(n_examples)
透過這段程式碼,我們能夠觀察到數據集的結構和內容,為接下來的知識推薦魔法奠定基礎。在這個過程中,我們會學習到 embeddings 的基礎知識,並且探索如何利用它們來發掘相似的文章。